استخراج خودکار اطلاعات از تالارهای گفتمان

thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه تحصیلات تکمیلی علوم پایه زنجان - دانشکده ریاضی و کامپیوتر
author سعید سارنچه
adviser بهرام صادقی بی غم vidyasagar p
Number of pages: First 15 pages
publication year 1390

abstract

با همه گیرشدن استفاده از اینترنت و افزایش توان تولید اطلاعات و نرخ بارگزاری آن به شبکه جهانی اطلاعات، دسترسی به اطلاعات در این شبکه با مشکلاتی مواجه کرده است که نیاز به استفاده از ابزار های کمکی جهت دسترسی سریع به اطلاعات مفید می باشد. امروزه موتورهای جستجو از علم داده کاوی برای ارائه سرویس های مناسب و مفید برای کاربران خود استفاده می نمایند. از آنجایی که اطلاعات وارد شده اطلاعاتی هستند که به نوعی در زندگی روزمره کاربران تولید می شوند. اطلاعاتی در مورد سلیقه ها، تفریحات، عقاید و سوالات کاربران که توسط ابزارهای دیجتال کاربر بارگزاری می گردند، پس با پردازش این اطلاعات می توان از داده های خام، اطلاعاتی را استخراج کرد که در نگاه اول دور از دسترس می باشند. امروزه بیشتر کاربران از نرم افزار های جدید به عنوان web 2.0 برای ارائه اطلاعات بر روی وب استفاده می کنند. این نوع نرم افزار ها برای ایجاد یک محیط برای اشتراک گذاری اطلاعات ایجاد شده اند و همچنین امکان مدیریت اطلاعات را به کاربران می دهند. یکی از این نرم افزار ها که مورد استقبال کاربران قرار گرفته است نرم افزا تالار گفتمان (forum) می باشد. این نرم افزار تلاش می کند تا محیطی برای بحث و گفتگوی کاربران ایجاد نماید و کاربران نیاز های خود، سوالات، نظرات خود را در مورد بحث های مختلف را ثبت نمایند. امروزه افراد، شرکت ها، سازمانهای دولتی و موسسات آموزشی از این سیستم به عنوان کانال ارتباطی بین خودشان و کاربران استفاده می نمایند. نوکیا، سیستم عامل ubuntu و دانشگاه iasbs از تالار گفتمان برای ایجاد ارتباط مفید و دو سویه از این نرم افزار استفاده می کنند. تالار گفتمان مربوط به ubuntu دارای نزدیک به یک میلیون کاربر می باشد که این کاربران توانسته اند نزدیک به 9.5 میلیون مطلب را در تالار پست نمایند. که به مطالب، سوالات و پاسخ های متفاوتی در باره این سیستم عامل اشاره شده است بطوریکه روزانه تعداد زیادی از کاربران با مراجعه به این سایت مشکل خودشان را حل می کنند. این شهرت و استقبال کاربران مشکلاتی را نیز به همراه داشته است. از جمله این مشکلات افزایش کاربرانی است که داده های هجو در این تالار ها وارد می کنند. امروزه spammer ها با استفاده از ابزارهای مربوط به یادگیری ماشین توانسته اند تا از سد های مختلف عبور کنند و این مطالب را وارد تالار های گفتمان کنند. در عین حال تشخیص این نوع کاربران از کاربران دیگر مشکل می باشد. تنها راه حل بررسی رفتاری این نوع از کاربران می باشد که این هم نیاز به پردازش اطلاعات پست شده در تالارگفتمان را دارد که این کار را میتوان از طریق استخراج اطلاعات انجام داد.

Already have an account?login

similar resources

استخراج خودکار جملات هم‌تراز انگلیسی-فارسی از متون مقایسه‌ای با بهره‌برداری از اطلاعات نحوی

پیکره‌های موازی همواره از غنی‌ترین منابع در مباحث پردازش زبان طبیعی محسوب می‌شوند. این نوع پیکره‌ها شامل متون ترجمه‌شدۀ دو یا چند زبان هستند که در سطوح مختلف کلمه، عبارت و یا جمله هم‌ترازشده‌اند. علیرغم کاربرد فراوان این نوع پیکره‌ها در مطالعات مختلف از جمله پژوهشهای زبانی، ترجمة ماشینی آماری و سامانه‌های خودکار بازیابی اطلاعات میان زبانی، متأسفانه همواره پژوهشگران با کمبود پیکره‌های موازی مو...

full text

ارائه روشی جدید برای شاخص‌گذاری خودکار و استخراج کلمات کلیدی برای بازیابی اطلاعات و خوشه‌بندی متون

Persian words in writing with a diverse and cover all modes of grammatical words with the recruitment of a series of specific rules because it is impossible to extract keywords automatically from Persian texts difficult and complex. This thesis has attempted to use linguistic information and thesaurus, keywords Mnatry be provided. Using the symbol system is structured network can be keywords, i...

full text

استخراج خودکار عبارتهای کلیدی از متون مقاله‌های فارسی

در پژوهش حاضر، عبارتهای کلیدی از متون مقاله‌های فارسی به صورت خودکار جداسازی گردیده است. استخراج عبارتها مبتنی بر روشهای آماری، نحوة توزیع واژگان، مجاورت و ... صورت پذیرفته است. سیستمی که بر پایه پژوهش حاضر طراحی گردیده، با توجه به بازخوردهای کاربر از قابلیت یادگیری برخوردار است، با توجه به بازخوردهای کاربر از قابلیت یادگیری برخوردار است، به گونه‌ای که در طول زمان مرتباً به کارایی آن افز...

full text

استخراج خودکار معادل‎های واژگانی از پیکره‎های دو زبانه موازی

امروزه به مدد ظهور انواع فناوری‌های رایانه‌ای، پیکره‌های زبانی نقش بسیار مهمی در حل انواع مختلف مسائل زبانشناختی ایفا می‎کنند. پیکره‌های دو زبانه موازی در سطح جمله و در سطح واژه می‎توانند برای بازیابی واحدهای تک‌واژه‌ای و یا حتی چند واژه‎ای براحتی مورد‌ استفاده قرار‎گیرند که این امر کاربردهای مفیدی در حوزه‎های مختلف رایانه و زبان خواهد‎ داشت. هدف این مقاله به‌کارگیری یک پیکره موازی انگلیسی– فا...

full text

استخراج و بازسازی خودکار اطلاعات سه‌بعدی زمین فوتبال در تصاویر تک‌دوربینی کالیبره‌نشده

full text

تبیین مفهوم گفتمان مدنی در عرصه های عمومی شهری با رویکردی اکتشافی؛ از حمام ها تا تالارهای شهری

این مقاله فاقد چکیده میباشد.

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}

document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه تحصیلات تکمیلی علوم پایه زنجان - دانشکده ریاضی و کامپیوتر

Keywords

داده کاوی استخراج اطلاعات

Hosted on Doprax cloud platform doprax.com